d_model = 512  # 输入到网路的词向量维度\是embedding的维度\是PE的最后一维度
d_k = 64  # w_q\w_k\w_v的维度
Max_len = 40  # 最大句长
head_en = 8  # 多头注意力head的个数
# 前馈网络的参数，其中输入输出维度跟d_model一样就不设置了，直接用d_model
Hidden_size = 2048  # 中间层的全连接神经元个数dff
en_N = 6
de_N = 6
vocab_input_len = 7926
vocab_target_len = 12556
##########################################################################
batch_size = 128
data_path = "./data/e2c.xlsx"
PAD = 0
SOS = 1
EOS = 2
